新世野是高下制图推出的数据可视化的案例推荐栏目,我们将定期为您带来全球优秀信息的可视化案例。
2020年是一个不平凡的年度,人类社会正面临着严峻的挑战——covid-19肆虐全球。如何衡量该流行病毒带来的损失变得尤为重要,从宏观上看,有利于专家对流行病的发展做出判断,从而帮助各个国家抑制病毒的进一步泛滥;从微观上看,这有利于普通民众了解真实的流行病毒危害,从而积极防护。
受制于不同国家的政策制度以及经济水平,故官方给出的统计数据口径并不一致。这对于研究而言,就会出现很大的误差,真实的死亡人数往往是大于官方给出的数据。
《经济学人》为了解决这些客观难题,在衡量死亡率时他们会选择查看该地区的 "超额死亡",即用因各种原因死亡人数与往年同期的平均人数作比较。而他们的数据来源有两种:一是少数几个统计局定期提供的有关死亡率的公开数据;二是使用EuroMOMO(欧洲死亡率监测组织:European mortality monitoring)的数据。接下来就带大家一起看看《经济学人》的记者是如何实际操作的!对于衡量病毒传播情况而言,最大的一个挑战就是每个国家收集数据的方式不同;除此以外,各国的数据质量和数据频率也不相同。就比如西班牙每天都会发布数据,但数据却有很大的滞后性以及不确定性;而英国虽然每周发布一次,但数据是值得信赖的。所以经济学人的记者就会采用前几年同一周的平均数来确定 "预期死亡 "基准。
对于一些发展中国家而言,受制于技术水平的因素,他们的死亡数据也是不可靠的;就比如土耳其官方甚至没有定期给出按地区分列的 covid-19死亡人数,所以记者只能根据4月1日的报告来估算。有时候就连一些发达国家也不能给出完整的数据,也需要记者根据以前的报告去预测。
除此以外,记者还需要解决不同数据之间的格式和语言问题;通常他会采用 R 语言写脚本来帮助自己做数据清理工作。该脚本长约1000行,作用是把各个国家的数据输出为相同格式的 CSV 文件。然后将文件放入 Github 库,交由其他同事制作动态图表来进行数据追踪。
除此以外,原文还介绍了 Euro MOMO (欧洲死亡率监测组织)是如何估算死亡数据的,并且附有详细访谈记录。您可以扫码或者点击阅读原文,了解更多内容。
还在为如何制作精美图表苦恼头秃么?全新推出高下制图app,不断更新的制图模板,随心更改样式,轻松一键制图。现在积极参与高下制图内测,更有机会获得正式版会员,享受轻松作图哦。更多详情请扫码进群了解。